home *** CD-ROM | disk | FTP | other *** search
/ PC World 2003 January / PCWorld_2003-01_cd.bin / Software / Vyzkuste / rychlokurz / httrack.exe / {app} / src / htsjava.c < prev    next >
C/C++ Source or Header  |  2002-10-11  |  10KB  |  410 lines

  1. /* ------------------------------------------------------------ */
  2. /*
  3. HTTrack Website Copier, Offline Browser for Windows and Unix
  4. Copyright (C) Xavier Roche and other contributors
  5.  
  6. This program is free software; you can redistribute it and/or
  7. modify it under the terms of the GNU General Public License
  8. as published by the Free Software Foundation; either version 2
  9. of the License, or any later version.
  10.  
  11. This program is distributed in the hope that it will be useful,
  12. but WITHOUT ANY WARRANTY; without even the implied warranty of
  13. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  14. GNU General Public License for more details.
  15.  
  16. You should have received a copy of the GNU General Public License
  17. along with this program; if not, write to the Free Software
  18. Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
  19.  
  20.  
  21. Important notes:
  22.  
  23. - We hereby ask people using this source NOT to use it in purpose of grabbing
  24. emails addresses, or collecting any other private information on persons.
  25. This would disgrace our work, and spoil the many hours we spent on it.
  26.  
  27.  
  28. Please visit our Website: http://www.httrack.com
  29. */
  30.  
  31.  
  32. /* ------------------------------------------------------------ */
  33. /* File: Java classes parser                                    */
  34. /* Author: Yann Philippot                                       */
  35. /* ------------------------------------------------------------ */
  36.  
  37.  
  38. /* Version: Oct/2000 */
  39. /* Fixed: problems with class structure (10/2000) */
  40.  
  41. // htsjava.c - Parseur de classes java
  42.  
  43. #include "stdio.h"
  44. #include "htsglobal.h"
  45. #include "htscore.h"
  46.  
  47. #include "htsjava.h"
  48.  
  49. #include <stdio.h>
  50. #include <stdlib.h>
  51. #include <string.h>
  52.  
  53. #include "htsnostatic.h"
  54.  
  55. //#include <math.h>
  56.  
  57. static int reverse_endian(void) {
  58.     int endian = 1;
  59.     return ( * ( (char*) &endian) == 1);
  60. }
  61.  
  62. /* big/little endian swap */
  63. #define hts_swap16(A) ( (((A) & 0xFF)<<8) | (((A) & 0xFF00)>>8) )
  64. #define hts_swap32(A) ( (( (hts_swap16(A)) & 0xFFFF)<<16) | (( (hts_swap16(A>>16)) & 0xFFFF)) )
  65.  
  66.  
  67. // ** HTS_xx sinon pas pris par VC++
  68. #define HTS_CLASS  7
  69. #define HTS_FIELDREF  9
  70. #define HTS_METHODREF  10
  71. #define HTS_STRING  8
  72. #define HTS_INTEGER  3
  73. #define HTS_FLOAT  4
  74. #define HTS_LONG  5
  75. #define HTS_DOUBLE  6
  76. #define HTS_INTERFACE  11
  77. #define HTS_NAMEANDTYPE  12
  78. #define HTS_ASCIZ  1
  79. #define HTS_UNICODE  2
  80.  
  81. #define JAVADEBUG 0
  82.  
  83. int hts_detect_java(htsmoduleStruct* str) {
  84.   char* savename = str->filename;
  85.   if (savename) {
  86.     int len = (int) strlen(savename);
  87.     if (len > 6 && strfield(savename + len - 6,".class")) {
  88.       return 1;
  89.     }
  90.   }
  91.   return 0;
  92. }
  93.  
  94. int hts_parse_java(htsmoduleStruct* str)
  95. {
  96.   FILE *fpout;
  97.   JAVA_HEADER header;
  98.   RESP_STRUCT *tab;
  99.   char* file = str->filename;
  100.   
  101.   str->relativeToHtmlLink = 1;
  102.  
  103. #if JAVADEBUG
  104.   printf("fopen\n");
  105. #endif
  106.   if ((fpout = fopen(fconv(file), "r+b")) == NULL)
  107.   {
  108.     //fprintf(stderr, "Cannot open input file.\n");
  109.     sprintf(str->err_msg,"Unable to open file %s",file);
  110.     return 0;   // une erreur..
  111.   }
  112.     
  113. #if JAVADEBUG
  114.   printf("fread\n");
  115. #endif
  116.   //if (fread(&header,1,sizeof(JAVA_HEADER),fpout) != sizeof(JAVA_HEADER)) {   // pas complet..
  117.   if (fread(&header,1,10,fpout) != 10) {   // pas complet..
  118.     fclose(fpout);
  119.     sprintf(str->err_msg,"File header too small (file len = "LLintP")",(LLint)fsize(file));
  120.     return 0;
  121.   }
  122.  
  123. #if JAVADEBUG
  124.   printf("header\n");
  125. #endif
  126.   // tester en tΩte
  127.   if (reverse_endian()) {
  128.     header.magic = hts_swap32(header.magic);
  129.     header.count = hts_swap16(header.count); 
  130.   }
  131.   if(header.magic!=0xCAFEBABE) {
  132.     sprintf(str->err_msg,"non java file");
  133.     if (fpout) { fclose(fpout); fpout=NULL; }
  134.     return 0;
  135.   }
  136.  
  137.   tab =(RESP_STRUCT*)calloct(header.count,sizeof(RESP_STRUCT));
  138.   if (!tab) {
  139.     sprintf(str->err_msg,"Unable to alloc %d bytes",(int)sizeof(RESP_STRUCT));
  140.     if (fpout) { fclose(fpout); fpout=NULL; }
  141.     return 0;    // erreur..
  142.   }
  143.  
  144. #if JAVADEBUG
  145.   printf("calchead\n");
  146. #endif
  147.   {
  148.     int i;
  149.     
  150.     for (i = 1; i < header.count; i++) {
  151.       int err=0;  // ++    
  152.       tab[i]=readtable(str,fpout,tab[i],&err);
  153.       if (!err) {
  154.         if ((tab[i].type == HTS_LONG) ||(tab[i].type == HTS_DOUBLE)) i++;  //2 element si double ou float
  155.       } else {    // ++ une erreur est survenue!
  156.         if (strnotempty(str->err_msg)==0)
  157.           strcpybuff(str->err_msg,"Internal readtable error");
  158.         freet(tab);
  159.         if (fpout) { fclose(fpout); fpout=NULL; }
  160.         return 0;
  161.       }
  162.     }
  163.     
  164.   }
  165.  
  166.   
  167. #if JAVADEBUG
  168.   printf("addfiles\n");
  169. #endif
  170.   {
  171.     unsigned int acess;
  172.     unsigned int Class;
  173.     unsigned int SClass;
  174.     int i;
  175.     acess = readshort(fpout);
  176.     Class = readshort(fpout);
  177.     SClass = readshort(fpout);
  178.     
  179.     for (i = 1; i <header.count; i++) {
  180.       
  181.       if (tab[i].type == HTS_CLASS) {
  182.         
  183.         if ((tab[i].index1<header.count) && (tab[i].index1>=0)) {
  184.           
  185.           
  186.           if((tab[i].index1!=SClass) && (tab[i].index1!=Class) && (tab[tab[i].index1].name[0]!='[')) {
  187.             
  188.             if(!strstr(tab[tab[i].index1].name,"java/")) {
  189.               char tempo[1024];
  190.               tempo[0]='\0';
  191.               
  192.               sprintf(tempo,"%s.class",tab[tab[i].index1].name);
  193. #if JAVADEBUG
  194.               printf("add %s\n",tempo);
  195. #endif
  196.               if (tab[tab[i].index1].file_position >= 0)
  197.                 str->addLink(str,tempo);  /* tab[tab[i].index1].file_position */
  198.             }
  199.             
  200.           }
  201.         } else { 
  202.           i=header.count;  // exit 
  203.         }
  204.       }
  205.       
  206.     }
  207.   }
  208.   
  209.  
  210. #if JAVADEBUG
  211.   printf("end\n");
  212. #endif
  213.   freet(tab);
  214.   if (fpout) { fclose(fpout); fpout=NULL; }
  215.   return 1;
  216. }
  217.  
  218.  
  219.  
  220.  
  221. // error: !=0 si erreur fatale
  222. RESP_STRUCT readtable(htsmoduleStruct* str, 
  223.                       FILE *fp, RESP_STRUCT trans, int* error)
  224. {
  225.   unsigned short int length;
  226.   int j;
  227.   *error = 0;  // pas d'erreur
  228.   trans.file_position=-1;
  229.   trans.type = (int)(unsigned char)fgetc(fp);
  230.   switch (trans.type) {
  231.   case HTS_CLASS:
  232.     strcpybuff(trans.name,"Class");
  233.     trans.index1 = readshort(fp);
  234.     break;
  235.     
  236.   case HTS_FIELDREF:
  237.     strcpybuff(trans.name,"Field Reference");
  238.     trans.index1 = readshort(fp);
  239.     readshort(fp);
  240.     break;
  241.     
  242.   case HTS_METHODREF:
  243.     strcpybuff(trans.name,"Method Reference");
  244.     trans.index1 = readshort(fp);
  245.     readshort(fp);
  246.     break;
  247.     
  248.   case HTS_INTERFACE:
  249.     strcpybuff(trans.name,"Interface Method Reference");
  250.     trans.index1 =readshort(fp);
  251.     readshort(fp);
  252.     break;
  253.   case HTS_NAMEANDTYPE:
  254.     strcpybuff(trans.name,"Name and Type");
  255.     trans.index1 = readshort(fp);
  256.     readshort(fp);
  257.     break;
  258.     
  259.   case HTS_STRING:                // CONSTANT_String
  260.     strcpybuff(trans.name,"String");
  261.     trans.index1 = readshort(fp);
  262.     break;
  263.     
  264.   case HTS_INTEGER:
  265.     strcpybuff(trans.name,"Integer");
  266.     for(j=0;j<4;j++) fgetc(fp);
  267.     break;
  268.     
  269.   case HTS_FLOAT:
  270.     strcpybuff(trans.name,"Float");
  271.     for(j=0;j<4;j++) fgetc(fp);
  272.     break;
  273.     
  274.   case HTS_LONG:
  275.     strcpybuff(trans.name,"Long");
  276.     for(j=0;j<8;j++) fgetc(fp);
  277.     break;
  278.   case HTS_DOUBLE:
  279.     strcpybuff(trans.name,"Double");
  280.     for(j=0;j<8;j++) fgetc(fp);
  281.     break;
  282.     
  283.   case HTS_ASCIZ:
  284.   case HTS_UNICODE:
  285.     
  286.     if (trans.type == HTS_ASCIZ)
  287.       strcpybuff(trans.name,"HTS_ASCIZ");
  288.     else
  289.       strcpybuff(trans.name,"HTS_UNICODE");
  290.     
  291.     {
  292.       char buffer[1024]; 
  293.       char *p;
  294.       
  295.       p=&buffer[0];
  296.  
  297.       //fflush(fp); 
  298.       trans.file_position=ftell(fp);
  299.       length = readshort(fp);
  300.       if (length<HTS_URLMAXSIZE) {
  301.         // while ((length > 0) && (length<500)) {
  302.         while (length > 0) {
  303.           *p++ =fgetc(fp);
  304.           
  305.           length--;
  306.         }
  307.         *p='\0';
  308.         
  309.         //#if JDEBUG
  310.         //      if(tris(buffer)==1) printf("%s\n ",buffer);
  311.         //      if(tris(buffer)==2)  printf("%s\n ",printname(buffer));
  312.         //#endif
  313.         if(tris(buffer)==1)  str->addLink(str, buffer);       /* trans.file_position */
  314.         else if(tris(buffer)==2)  str->addLink(str, printname(buffer));
  315.  
  316.         strcpybuff(trans.name,buffer);
  317.       } else {    // gros pb
  318.         while ( (length > 0) && (!feof(fp))) {
  319.           fgetc(fp);
  320.           length--;
  321.         }
  322.         if (!feof(fp)) {
  323.           trans.type=-1;
  324.         } else {
  325.           sprintf(str->err_msg,"Internal stucture error (ASCII)");
  326.           *error = 1;
  327.         }
  328.         return(trans);
  329.       }
  330.     }
  331.     break;
  332.   default:
  333.     // printf("Type inconnue\n");
  334.     // on arrΩte tout 
  335.     sprintf(str->err_msg,"Internal structure unknown (type %d)",trans.type);
  336.     *error = 1;
  337.     return(trans);
  338.     break;
  339.   }  
  340.   return(trans);
  341. }
  342.  
  343.  
  344. unsigned short int readshort(FILE *fp)
  345. {
  346.   unsigned short int valint;
  347.   fread(&valint,sizeof(valint),1,fp);
  348.  
  349.   if (reverse_endian())
  350.     return hts_swap16(valint);
  351.   else
  352.     return valint;
  353.   
  354. }
  355.  
  356. int tris(char * buffer)
  357. {
  358.   //
  359.   // Java
  360.   if((buffer[0]=='[') && buffer[1]=='L' && (!strstr(buffer,"java/")) ) 
  361.     return 2;
  362.   if (strstr(buffer,".gif") || strstr(buffer,".jpg") || strstr(buffer,".jpeg") || strstr(buffer,".au") ) 
  363.     return 1;
  364.   // Ajouts R.X: test type
  365.   // Autres fichiers
  366.   {
  367.     char type[256];
  368.     type[0]='\0';
  369.     get_httptype(type,buffer,0);
  370.     if (strnotempty(type))     // type reconnu!
  371.       return 1;
  372.     // ajout RX 05/2001
  373.     else if (is_dyntype(get_ext(buffer)))   // asp,cgi...
  374.       return 1;
  375.   }
  376.   return 0;
  377. }
  378.  
  379.  
  380. char * printname(char  name[1024])
  381. {
  382.   char* rname;
  383.   //char *rname;
  384.   char *p;
  385.   char *p1;
  386.   int j;
  387.   NOSTATIC_RESERVE(rname, char, 1024);
  388.   rname[0]='\0';
  389.   //
  390.  
  391.   p=&name[0];
  392.   
  393.   if(*p!='[')  return "";
  394.   p+=2;
  395.   //rname=(char*)calloct(strlen(name)+8,sizeof(char));
  396.   p1=rname;
  397.   for (j = 0; j < (int) strlen(name); j++,p++) {
  398.     if (*p == '/') *p1='.'; 
  399.     if (*p==';'){*p1='\0';
  400.     strcatbuff(rname,".class");
  401.     return (rname);}
  402.     else *p1=*p;
  403.     p1++;
  404.   }
  405.   p1-=3;
  406.   *p1='\0';
  407.   return (rname);
  408.   
  409. }
  410.